我是安神, 我为因果推断计量代言
欢迎投稿(荐稿)计量经济圈,计量相关都行
邮箱:econometrics666@sina.cn
编辑: 计量经济圈; 来源: 格致出版社 (微信公众号); 译者: 李井奎, 高洁; 感谢授权; 译者之一是咱们计量经济圈社群成员, 感谢他和他的伙伴的辛勤付出; 一定要好好读这个可能获得诺奖的大神的作品。
原文载于:Journal of Economic Perspectives, Volume 31, Number 2, Spring 2017, Pages 125–144
原文标题:Undergraduate Econometrics Instruction: Through Our Classes, Darkly
摘要:过去的半个世纪,经济学研究日益趋向经验化,同时经济学经验研究的本质也发生了改变。在20世纪60年代和70年代,经验经济学家的主要任务是去解释诸如收入或者GDP增长这样的经济变量。发展演变到今天,应用计量经济学最关心的问题,已经变为对具体因果效应的估计以及经验政策分析,而不再是用以得出经济结果的一般性模型。然而,当今的计量经济学教学基本上仍旧是以抽象的方式展开,重点仍然是寻找满足经典回归假设的“真实模型”,并解决与经典回归假设相关的技术问题。研究设计和因果关系问题已经上升到现代经验研究的首要位置,但是其相关议题在教学中仍居于次要位置。本文追溯了计量经济学教学与经验研究实践之间的发展脱节,主张教学范式亟待改变。
随着石器时代让位于计算机时代,对经济体的各种理论描述进行参数估计,一度是应用计量经济学最关心的问题。诸如对失业和产出这类总体经济变量做出描述的多方程宏观模型,以及以个体行为人选择或市场均衡水平为特征的微观模型,就是其中标准的例子。在20世纪60年代和70年代,典型的经验分析框架是要在一长串各式各样的解释变量的帮助下,寻求对经济结果的解释,但并不特别关注其中的某一个变量。
而当今的经验研究则尝试针对具体的问题寻找答案,而非为诸如GDP增长这类现象提供一般性的理解。这种研究的目标,是搞清楚某一个因素的因果效应,比如移民对工资的影响,或民主化对GDP增长的影响,关注的往往是对小企业的补贴带来的就业影响,或者货币政策的效果这样的政策问题。今天的应用研究人员为回答诸如此类的问题而寻找着各种可信的策略。
近几十年,经验经济学变化很大。但正如我们后文所见,计量经济学教学则改变不大。销量领先的计量经济学教材关心的仍然是回归背后的模型假设及相关考虑,目的是帮助学生对产生经济结果的过程作出统计学上正确的估计。大部分的书都是优先探讨技术问题,而不是概念上的思考。举个例子,我们仍然可以看到教材对函数的形式,对误差项是否独立同分布,对如何纠正序列相关和异方差,展开长篇大论。然而,这样的教学设计对于现代经验研究而言基本上无足轻重。同时,像倍差法(DID,又译“双重差分法”)和断点回归法这类新颖而被广泛使用的工具,在教材中即便被提到也是草草了事。
我们如何根据计量经济学应用发生的变化,来调整计量经济学的教学方式呢?
我们的办法很简单。首先从基于随机试验和准实验方法的经验策略入手,之所以如此,是因为它们提供了揭示因果推断时会遇到的诸般挑战,以及计量经济学工具应对这些挑战之方式的一个样板。我们把这一框架称之为基于设计的计量经济学方法(design-based approach to econometrics)。之所以这样称呼它,是因为成功运用这一方法所需要的技能和策略与研究设计息息相关。这一视角给出了我们改变教学的第一个具体药方:修正我们在教学中讲授回归的方式。
回归应该按照现在最经常被使用的方式来教——把它当成控制共生变量的工具。这种方法摈弃了把所有回归变量同等对待的传统回归框架。在教学上重点突出统计学上的有效性和函数形式,让学生去认识一种以似是而非的精确的统计学语言定义的“真实模型”,而限于学生的程度,这种一知半解的叙述又往往失之粗浅——这种教学方式应当休矣。反之,我们应该关注的是:为确保在回归估计下我们感兴趣的经济变量的影响具有因果性解释,需要控制哪些变量?
除了要对回归教学做出根本性的纠正,我们的课堂教学还应该反映近年来经济学家们为寻找因果关系而大量运用准实验方法和随机试验的现象,把这些工具置于课堂的核心。基于设计的方法重视单方程工具变量估计量、断点回归方法,以及各类倍差识别策略,同时关注在对这些基本工具所得来的估计值进行因果性解释时,可能会遇到的具体问题。
最后,真实的经验研究工作应该在课堂上扮演着中心的角色。通过案例进行计量经济学教学,可以收到比抽象的教学更好的效果。
因果性问题和研究设计并不是计量经济学研究中唯一有意义的部分。但作为教师和研究者,经验告诉我们应该在课堂上强调这些技能。一方面,对这类技能的需求很大:在Google和Netflix的招聘广告中,可以看到“因果推断”(causal inference)、“实验设计”(experimental design)、“广告效果估计”(advertising effectiveness)这样的关键词;Facebook的数据科学团队非常关注可控随机试验和因果推断;Amazon为潜在的雇员提供简约式计量分析、因果评估或者项目评估方向的职位。[原注:还可参见Ayres(2007)、Brynjolfsson and McAfee (2011)、 Christian (2012),以及Kohavi(2015)等文对现代私有部门的计量经济研究的介绍。]
当然,在硅谷所感兴趣的应用微观经济学项目以及我们自己主要从事的经验劳动经济学之外,还有其他的计量经济学需要研究。但我们所钟爱的工具对于几乎任何经验研究而言都非常根本。对于像大衰退以及重要的通信公司合并这些众所熟悉的经济现象所做的专业讨论,也总是围绕着因果效应展开。同样,珍妮特·耶伦(Janet Yellen)和美联储内辅助其工作的数以百计的研究人员也渴望能够就X是否导致了Y给出可靠的证据。当然,纯粹的描述性研究仍然有其一席之地,基于数据而做出预测的工作也起着应有的作用。应用计量经济学家很久以来就在这些领域耕耘,而这些宝贵的技能对于统计学和(从事预测时)计算机科学等学科也很重要。但这方面的辛勤努力并不是我们的比较优势所在。最好的计量经济学研究中,可以看出清晰的因果性思考,计量经济学从其他数据科学中脱颖而出也正是因为这一点。因此,我们不断在课堂上对这种思考加以强调。
计量经济学教学向基于设计的经验研究的转变,前面已经有了简要介绍。为了让讨论更加充分,我们将思考计量经济学教学的基础,集中关注新旧两种讲授回归的方法。然后,我们将对一系列经典的和当代的计量经济学教材,以及部分当代的阅读清单和课程大纲做一番检视。与今天那些市面上流行的书籍相比,我们样本中的阅读清单更多地涵盖了现代经验方法。但是大多数的计量经济学课程仍然裹足不前,充斥着无聊且已经过时的技术内容。
好时代,坏时代
Panhans和Singleton(2016)记述了经济学家对准实验方法和随机试验运用的爆炸性增长。Angrist和Krueger(1999)就劳动经济学中早期的经验研究趋势进行了描述,但这一趋势现在已经更为普遍地见诸应用微观经济学的各个领域。在论述经验研究风气改变的一篇文章里(Angrist and Pischke, 2010),我们对现代的宏观研究议程曾经提出过异议。所以,我们很高兴看到,基于设计的研究方法近年来成功进入了经验宏观经济学的领域[Fuchs-Schuendeln and Hassan(2016)对此进行了描述]。Bowen、Frésard和Taillard(2016)就公司金融的经验研究对准实验方法越来越多的采用也做了介绍。
基于设计的经验分析很自然地把研究者的注意力集中在了堪称其特色的计量经济学工具上来。基于设计的研究趋势带来的一个不那么明显的智识后果,就是我们对线性回归工具的使用发生了变化。
昨天的论文 v.s. 今日的论文
对回归估计值的解释发生了变化,这一点可以通过对比两篇关于教育生产的研究而加以说明。这两篇研究分别是:Summers和Wolfe(1977),以及Dale和Krueger(2002)。两篇论文研究的都是学校对人力资本的影响:Summers和Wolfe研究的是小学的特征对学生成绩的影响;Dale和Krueger研究的是大学的特征对毕业后收入的影响。这些问题在本质上都是类似的,但二者的分析则大相径庭。
Summers和Wolfe(1977)认为他们的任务是要对决定学生成绩的复杂过程进行建模。他们从一个一般性的教育生产模型入手,这个模型囊括了很多未作详细说明的学生特征、教师特征、学校投入,以及同群的构成。这个模型的灵感来源,大致是要向人力资本理论寻求启示。但是作者们也承认,决定学生成绩的那些具体因素,仍然蒙着一层神秘的面纱。这个框架的突出问题就是缺乏对具体特征的明确界定:Summers和Wolfe的回归把学生测试成绩从3等到6等,置于左边;把学生与学校的29个特征置于右边。这个29个特征包括:家庭收入、学生的智商、性别、种族;教师所在的大学质量以及教师的经验;班级规模和入学登记;同群构成与同群行为的衡量指标等等。
Summers和Wolfe的论文真实再现了20世纪70年代的经验研究任务,那就是使用一大堆解释变量来寻找真实的模型:
我们可以很有信心地说,对于这个囊括了627名小学生的集合来说,这些系数以一种合理的方式描述了学生成绩和GSES(基因禀赋及社会地位)、TQ(教师质量)、SQ(教师因素之外的学校质量),以及PG(同群特征)之间的关系。
本着他们那个时代喜欢大范围回归分析的精神,Summers和Wolfe不认为其中有任何特定的变量集合值得被特殊对待,他们认为所有变量都是理所当然值得考虑的因素。同时,他们又将回归估计解读为捕捉因果关系的过程。所以他们可以从经验结论中得出政策性的结论。比如说,建议学校不要把“国家教师考试成绩”(National Teacher Exam Score)作为决定是否雇用教师的指导标准。
这种对回归的解读是“石器时代”的计量经济学精神的体现。它们一般从一个试图描述经济过程的线性回归方程开始,有的人称之为“结构关系”。那个时代的许多作者进而还会认为,为了能得到无偏或一致的估计,分析人员必须假定回归误差均值独立于回归变量。但是,既然所有的回归残差都是基于正交的性质而生成的,我们很难相信这样的主张有助于我们清晰地思考方程式右边任何一个回归变量的因果效应。
Dale和Krueger(2002)研究的同样是关于学校的问题:去一所对生源要求更高的学校学习会不会带来更高的收入?同Summers和Wolfe(1977)一样,这个研究也是通过最小二乘(OLS)回归法来构思答案。但是两者有三个重要的不同点。第一个不同点,是对具体的因果关系的重视,而不再试图去“解释收入”。Dale和Krueger的研究对比了在不同生源水平的大学上学的学生。学校质量[由学校学生的平均高考(SAT)成绩度量]可能会影响收入,但不是唯一的一个因素。而且可以肯定的是,学校质量相对于收入的R2一定很小。但这个高度聚焦化的研究完全有理由进行下去,因为它致力于回答一个学生、老师和政策制定者都关心的因果性问题。
第二个突出的特点是设计了一个研究策略,为的是消除选择性偏误:毫无疑问,精英学校的毕业生(平均而言)赚得比其他学校的多。不过,鉴于精英学校在选择学生上很谨慎,所以很明显,这种收入上的差异可能反映的是选择性偏误。为了解决这个最核心的问题,Dale和Krueger的论文提出了一个对观测值进行选择的研究策略。
Dale和Krueger的研究设计,对那些申请了同样的几所学校、也被同样的学校录取的个体进行比较。有相同的申请—录取分组、却去不同学校就读的学生,彼此间的相似程度远大于未受限制的样本中的学生。他们的研究认为,同一个申请—录取分组内的学生在学校选择上的任何差异本质上都是意外造成(serendipitous),就像随机分配造成的差异一样。也就是说这种差异无关能力、积极性、家庭背景,以及任何本质上和潜在收入有关的因素。这个观点构成了Dale和Krueger论文中最重要的计量经济学内容(econometric content)。
第三个不同点是,Dale和Krueger的研究将回归等式右边的原因变量和控制变量清晰地区分开来。在现代研究范式中,回归变量不再被设计成具有同等重要的地位。相反,一次回归中只有一个变量是有因果效应的。其他的控制变量都服务于对这个核心原因变量的研究。[原注:我们之所以说“一次回归中只有一个变量”,这是因为Dale and Krueger (2002) 中有一些模型用学费来代替了大学的生源水平,作为感兴趣的因果变量。]
比如说,在教育产出的研究中,人口学变量和学生的其他特征前面的系数是不太可能有什么清晰的经济学解读的。那我们要怎么解读在早先Summers-Wolfe回归中智商的系数呢?这个系数只是说明,在回归对其他变量进行调节之后,智商和因变量这两个智力的指标是具有正相关关系的。另一方面,比如说像班级规模这样的学校环境特征有时也可能为学校管理当局所改变。我们可能的确想知道,班级规模的系数对于教育政策具有怎样的启示。
相较于传统回归标志性的对回归变量与误差项之间正交性的苍白陈述,现代回归这种对等式右边的原因变量和控制变量之间所作的区分,需要一些更加细微的假定。在给我们的学生讲述回归的过程时,哪些变量是原因变量,哪些是控制变量,以及原因变量和控制变量在回归中所扮演的不同角色,这些应该清楚地呈现给他们。
另一片土地:计量经济学教材与教学
传统计量经济学教材对经验案例的介绍很空洞。在Johnston(1972)的经典教材中,第一个经验应用是一个二元变量回归,这个回归将道路死亡率与有牌照的机动车的数量联系起来。例子重点关注数学统计计算,在那个时代,他的关注点无可厚非。然而,死亡率和牌照之间的关系为什么值得研究,得出来的估计又可能意味着什么,Johnson并没有对这些问题进行解释。Gujarati(1978)的第一个经验例子更有料。他运用一些年度观测值验证柯布—道格拉斯生产函数。生产函数显然揭示了因果关系,它是经济学理论的根本基石之一。关于生产函数的讨论,既有助于理解影响的程度,也有助于思考估计是否可能符合规模报酬不变。但是这方面的应用, 直到该书第107页才出现。
即便在几十年后,真正的经验性内容在流行的教材中仍然阙如。对经验案例的介绍大多还是把重点放在数学和统计技术上。15年前的一篇文章中,Becker和Greene(2001)对千禧之际的计量经济学教材和教学做了一番调查:
计量和统计一直被当成数学的分支学科来讲授,即便在商学院也是如此……教材和教学资料的重点,是放在对理论与技术细节的介绍和解释上,实践应用仅仅被给予次要的关注,而那些应用往往还是为了讲解眼前的步骤而生造出来的……很少有应用是以财经报纸、商业杂志和经济学学术期刊报道的事件为基础。
随着经济研究中广泛出现了趋向经验主义的潮流(参见:Hamermesh, 2013;Angrist et al.,2017),现在的教材跟被它们淘汰的上一代教材比起来,要更加重视经验。具体来说,与Becker和Greene(2001)所描述的那些计量教材相比,现代的计量经济学教材更有可能从头到尾都到把经验示例当作一个不可或缺的部分来处理。现代的计量教材经常还会附上网址,学生可以从中找到相关问题的真实经济数据,来做习题或者练习。
其实,现代的教材质量也并不尽如人意。今天教材中的许多例子依然矫揉造作,好像是为举例而举例。在我们看来,当代计量经济学教材给出的经验应用良莠不齐,这还并非最令人失望的事——比那更糟的是,这些书未能讨论现代的经验分析工具。Stock和Watson(2015)的书,是最接近现代研究范式的,而除此以外,没有一本现代的本科计量经济学教材提到过断点回归法(关于本科计量教材的调研见下文)。另外,基于倍差法(DID)的经验研究现在已经很普遍,可我们也极少见到有教材讨论倍差法模式下的政策分析在何种情形下会失效。计量经济学教材似乎有越来越脱离经验实践的风险。
上面这些对教材内容的断言,我们希望建立在更为坚实的经验基础之上。为此,我们调研了12本流行的计量经济学教材,根据内容对它们进行了分类——其中有6本是20世纪70年代的;另外6本是目前广泛使用的。为了得出这个经典书单,我们找到了Becker和Greene(2001)文章的表1列出的那些书(该表所列为两位作者成文时流行的本科教材)在20世纪70年代的早先版本。我们买到了这些书早先的第一版或者第二版。我们的这个经典教材书单包括:Kmenta(1971)、Johnston(1972)、Pindyck和Rubinfeld(1976)、Gujarati(1978)、Intriligator (1978),以及Kennedy(1979)。在70年代,研究生教材和本科生教材之间的差别,比现在更模糊:与现在的本科生课本不同,这些古早的教材有些还会用到线性代数。Intriligator、Johnston和Kmenta三人的教材明显要比另外三本更深一些。所以,我们在总结70年代的教材内容时,会把这三个人的书算进来统计一次,还会把这三本书排除掉再统计一次。
我们的当代教材书单收录的书是“开放教学大纲计划”网站(OpenSyllabusProject.org)给出的阅读清单中最常被提及的6本。具体来说,我们在该网站的“Syllabus Explorer”搜索引擎先用“Economics”筛选,再输入“Econometrics”搜索,最后得到的书单中最前面的几本,就会被我们视为现代的市场领先教材。
最后得到的书单是:Kennedy(2008)、Gujarati和Porter(2009)、Stock和Watson(2015)、Wooldridge(2016)、Dougherty(2016),以及Studenmund(2017)。[原注:这些书在亚马逊的计量经济学品类中名列前茅,在Nielsen公司2013年和2014年的销售数据中也居于市场领先地位(一个版本除外)。Dougherty(2016)在OpenSyllabusProject.org生成的书单中排名第8,而排第6的Hayashi(2000)显然是研究生教材,排第7的Maddala(1977)算不上太新。]
这12本计量教材的详细信息如下:
我们将这些教材的内容细化分解成了下面这些主题(尽管我们很清楚这样的处理不可能是完美的):
1. 二元回归 Bivariate Regression
2. 回归性质 Regression Properties
3. 回归推断 Regression Inference
4. 多元回归 Multivariate Regression
5. 遗漏变量偏误 Omitted Variables Bias
6. 假设失效与修复方法 Assumption Failures and Fix‐ups
7. 函数形式 Functional Form
8. 工具变量法 Instrumental Variables
9. 联立方程模型 Simultaneous Equations Models
10. 面板数据 Panel Data
11. 时间序列 Time Series
12. 因果效应 Causal Effects
13. 倍差法 Differences‐in‐differences
14. 断点回归法 Regression Discontinuity Methods
这个分类方法涵盖了上面这12本书,以及我们用过或读过的其他许多同类书中的绝大部分内容。我们的这个分类体系还特别纳入了三种计量工具:工具变量法、断点回归法和倍差法。据Panhans和Singleton(2016)所列的文献计量学数据显示,这三种工具运用率的提高最引人注目。[原注:Panhans and Singleton(2016)的文章,还记录了提及“自然实验”(natural experiment)与“随机控制试验”(randomized control trial)等术语的文献数量的增加。]我们统计了各个主题分别占据的书本页数,其中附录、练习、数学和统计知识的补充材料均不计入。另外,我们还单独为经验示例所占页数进行了统计,也就是那些介绍如何利用真实经济数据算得计量结果的内容。但是,许多教材中用到的人为编造数据的例子不计入统计。
惯性的力量
大致说来,传统教材都遵从一个相同的结构:首先介绍一个关于经济产出变量的线性模型;紧接着指出:根据假设,误差项要均值独立于或者不相关于回归变量。但是模型本身的目的,却往往没能交代清楚——模型到底是一个因果关系,用来描述特定回归变量的操控后果,还是一个统计预测工具呢?又或者是一个参数化的条件期望方程呢?
教材在介绍完误差正交独立的线性模型后,会给出一系列的假设。比如同方差假设、可变 (然而非随机的) 回归元,以及弱多重共线性假设。这些假设是为了得到经典线性回归中普通最小二乘估计的那些优良的统计性质:无偏性、标准误差的简单表达式,以及高斯—马尔可夫定理(最小二乘估计量是最优线性无偏估计量)。我们还发现,关于“回归性质”的初始讨论,在经典教材中的平均占比是11%—12%;通常紧随其后出现的是“回归推断”的内容,这部分在传统教材中的占比大约为13%。参见下表:
这些教材中占去最多篇幅的主题是“假设失效与修复方法”,比例大概是20%。其中包括对自相关、异方差和多重共线性的识别方法以及对应的补救方法。解决大部分这类弊病的方式都是以广义最小二乘的形式出现的。传统教材的另一个重点讨论主题是“联立方程模型”,占去了初级教材14%的篇幅;当把高阶教材也包含进去时,这个比例会上升到18%。讽刺地是,如果把三本较高阶的教材也算进来,关于“假设失效与修复方法”的内容在传统教材中所占的比例甚至还会更高。同时,“时间序列”也占了传统教材很大的篇幅,但“面板数据”却很少被提及。
而且,当代流行的计量教材中各个主题的比例分布与经典教材十分相似,这是上表的一个十分引人注目的特征。和“石器时代”一样,当代教材中过半的篇幅是关于“回归性质”“回归推断”“函数形式”,以及“假设失效与修复方法”。对比两个时代,其中最清晰的变化是“联立方程模型”在现代教材中占比的减少。这大致意味着传统多方程框架的使用率下降了,尤其是在宏观经济学方面。“联立方程模型”的篇幅有少量让位给了“面板数据”和“因果效应”,但比例终究有限;现代教材中篇幅增幅最大的,是讨论“函数形式”(主要围绕离散选择和有限因变量模型 )的内容。
我们的当代教材书单中,有些书经历了多个版本,而其中的初版是在“石器时代”问世。所以当我们发现Gujarati和Porter(2009)和Gujarati(1978)有相似的话题分布时,并不感到意外。但是,一些更晚进入市场的教材,仍然也沿袭了经典教材的框架。所幸的是,新近问世的教材至少会提及现代的话题。
上表中的最后一行显示,“石器时代”的教材适度使用了基于真实数据的经验示例,这个比例差不多是15%。这个比例在不同的教材中差异很大:在有些书中,这个比例是0(完全没有经验示例);而有些书讨论经验实证应用的篇幅,占去了全书的三分之一强。值得注意的是,我们样本里的这12本书中,最具经验导向的仍然是一本经典教材
——Pindyck和Rubinfeld(1976)。虽然当代教材关于经验的内容比例上升到20%到30%之间,但没有一本当代教材分配给案例的篇幅比例可以和Pindyck和Rubinfeld(1976)相比。[原注:我们倡导当代的本科计量经济学教材应该围绕经验案例展开。这一观点也体现在本文两位作者自己的书中,参见Angrist and Pischke(2015)。]
计量经济学课程都讲了什么
许多教师严重依赖自己的讲义,只是把教材作为补充材料或者是习题库。因此,更有可能反映现代经验研究范式的,或许是课程大纲和阅读书目,而不是教材。为了验证这个观点,我们在各种类别的大学和学院收集了本科计量经济学课程的教学大纲和讲课计划。[原注:Enrico Moretti提议我们可以查询教学大纲,我们对此表示感谢。]
我们考察了八类高校,课程教学大纲样本覆盖了每个类别中的10所最大的学校。这八个类别分别是研究型大学(极活跃)、研究型大学(活跃)、授予博士学位的大学、授予本科学位的学院四大类,每个大类中又有公立和私立之分,这样共有八类。最终的样本包括了各类大学和学院,比如俄亥俄州立大学、纽约大学、哈佛大学、东卡罗莱纳大学、美利坚大学、美国军事学院、德克萨斯基督教大学、加尔文学院与霍普学院(Hope College)。八个类别下的每一所目标学校都会被呈现在样本中,但是规模较大和较有声望的学院权数比重相对较大。大多数的教学大纲是2014年以来的,而最早的是从2009年开始的。还有少数学校提供了不止一份大纲。对于这些学校,我们会进行均值化处理,保证最后呈现在列表中的一个学校只占一个观测值。
针对每一所学校提供的课程信息,我们对是否涉及前面列出的主题进行了记录。一部分学校还提供了每一堂课的讲课计划,显示了不同的话题所占的讲课时间。值得注意的是,能从阅读清单和课程表中收集到的信息量,在这些课程中各不相同。例如,大多数课程都包含了被我们归类为“多元回归”的内容,但有些课程并不单把“回归推断”单列出来。这可能是因为,他们把“回归推断”作为回归单元中的一部分,而没有单独把它拿出来放到阅读清单之中。因为这个原因,更宽泛的主题看上去占到了更多的课堂时间。
即使考虑到这一点,我们仍然可以看出,计量经济学课程的讲课时间分布和教材的篇幅分布有许多相似之处(见下表)。具体而言,依然有超过半数的上课时间在讲授关于“回归性质”“回归推断”“假设失效与修复方法”,及“函数形式”的内容。与之相应,除“回归性质”之外的其他几个主题,都包含在大多数的阅读清单中。我们猜测,“回归性质”很可能已经包含在其他回归主题中了。
讲课时间分布表显示,只有不到6%的课程时间用来讨论与“因果效应”“倍差法”和“断点回归法”有关的主题,这比这三个主题在现代教材中所占的3.6%的比例,仅仅好了那么一点点。单方程的“工具变量法”只占了3.9%的讲课时间。平均来看,这个比例比任何时代的教材都要少,不管是老的还是新的。
人还是要看到生活的光明面。我们高兴地发现,超过四分之一的抽样教师分配了一些讲课时间来讨论“因果效应”和“倍差法”。一个比例不算太惨淡的少数群体(近17%)还是腾出了一部分时间来进行关于“断点回归法”的讨论。从这里我们可以看出,计量经济学教师是领先于计量经济学教材市场的。许多年轻的教师会在他们的博士期间用到现代经验方法,所以他们会想和学生分享这部分内容;而教材作者可能普遍比教师要年老,因此也就很少会有机会亲身接触到现代因果研究所强调的分析工具。
落后于时代
本科计量经济学教育急需在三个方面进行范式上的改变:
1. 聚焦于因果问题和经验示例,而不是模型和数学。
2. 修改已经过时的经典回归框架,不要再试图解释经济过程,而应该关注控制条件下的统计比较。
3. 重视现代的准实验工具。
我们意识到,变革从来不易。我们自己十年前开出的阅读清单与本文总结的那些差不了太多。但是,对研究实务与课堂教学之间的令人不安的缺口,我们有过深入的思考。正是因为这个原因,我们的教学方法已经发生了变化。
我们在研究中用到的计量经济学,是有趣的,有意义的,也是令人满意的。
为什么不教给学生这样的计量经济学呢?
参考文献
Angrist, Joshua D. 1998. “Estimating the Labor Market Impact of Voluntary
Military Service Using Social Security Data on Military Applicants.” Econometrica 66(2): 249—88.
Angrist, Joshua D., Pierre Azoulay, Glenn Ellison, Ryan Hill, and Susan Lu. 2017. “Economic Research Evolves: Citations to Fields and Styles.” American Economic Review 107(5): forthcoming.
Angrist, Joshua D. and Alan B. Krueger. 1999. “Empirical Strategies in Labor Economics.” Chapter 23 in Handbook of Labor Economics, edited by Orley Ashenfelter, and David Card, volume 3, 1277—1366. Elsevier.
Angrist, Joshua D. and Jörn-Steffen Pischke. 2009. Mostly Harmless Econometrics: An Empiricist’s Companion. Princeton University Press.
Angrist, Joshua D. and Jörn-Steffen Pischke. 2010. “The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics.” Journal of Economic Perspectives 24(2): 3—30.
Angrist, Joshua D. and Jörn-Steffen Pischke. 2015. Mastering Metrics: The Path from Cause to Effect. Princeton University Press.
Arcidiacono, Peter, Esteban M. Aucejo, and V. Joseph Hotz. 2016. “University Differences in the Graduation of Minorities in STEM Fields: Evidence from California.” American Economic Review106(3): 525—62.
Arellano, Manuel. 1987. “Computing Robust Standard Errors for Within-groups Estimators.” Oxford Bulletin of Economics and Statistics 49(4): 431—34.
Ayres, Ian 2007. Super Crunchers. Bantam Books.
Becker, William E., and William H. Greene. 2001. “Teaching Statistics and Econometrics to Undergraduates.” Journal of Economic Perspectives 15(4): 169—82.
Bertrand, Marianne, Esther Duflo, and Sendhil Mullainathan. 2004. “How Much Should We Trust Differences-In-Differences Estimates?” Quarterly Journal of Economics 119(1): 249—75.
Bowen, Donald E. III, Laurent Frésard, and Jérôme P. Taillard. Forthcoming. “What’s Your Identification Strategy? Innovation in Corporate Finance Research.” Management Science.
Brynjolfsson, Erik, and Andrew McAfee. 2011. “The Big Data Boom Is the Innovation Story of Our Time.” The Atlantic November 21.
Chamberlain, Gary. 1982. “Multivariate Regression Models for Panel Data.” Journal of Econometrics18(1): 5—46.
Christian, Brian. 2012. “The A/B Test: Inside the Technology That’s Changing the Rules of Business,”Wired April 25.
Dale, Stacy Berg, and Alan B. Krueger. 2002. “Estimating the Payoff to Attending a More Selective College: An Application of Selection on Observables and Unobservables.” Quarterly Journal of Economics 117(4): 1491—1527.
Fuchs-Schündeln, Nicola, and Tarek A. Hassan. 2016. “Natural Experiments in Macroeconomics.” Chapter 12 in Handbook of Macroeconomics, edited by John B. Taylor and Harald Uhlig, volume 2, 923—1012. Elsevier.
Goldberger, Arthur S. 1991. A Course in Econometrics. Harvard University Press.
Hamermesh, Daniel S. 2013. “Six Decades of Top Economics Publishing: Who and How?” Journal of Economic Literature 51(1): 162—72.
Hayashi, Fumio. (2000): Econometrics. Princeton University Press.
Kohavi, Ron. 2015. “Online Controlled Experiments: Lessons from Running A/B/n Tests for 12 Years.”Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM.
Maddala, G.S. 1977. Econometrics. McGraw-Hill.
Moulton Brent R. 1986. “Random Group Effects and the Precision of Regression Estimates” Journal of Econometrics 32(3): 385—97.
Newey, Whitney K. and Kenneth D. West. 1987. “A Simple, Positive Semidefinite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix” Econometrica 55(3): 703—08.
Panhans, Matthew T. and John D. Singleton. 2016. “The Empirical Economist’s Toolkit: From Models to Methods” Working Paper 2015-3, Center for the History of Political Economy.
Summers, Anita A. and Barbara L. Wolfe. 1977. “Do Schools Make a Difference?” American Economic Review 67(4): 639—52.
White, Halbert. 1980a. “A Heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity.” Econometrica 48(4): 817—38.
White, Halbert. 1980b. “Using Least Squares to Approximate Unknown Regression Functions.”International Economic Review 21(1): 149—70.
Yitzhaki, Shlomo. 1996. “On Using Linear Regressions in Welfare Economics.” Journal of Business & Economic Statistics 14(4): 478—86.
计量经济圈是中国计量第一大社区,我们致力于推动中国计量理论和实证技能的提升,圈子以海内外高校研究生和教师为主。计量经济圈六多精神:计量资料多,社会科学数据多,科研牛人多,名校人物多,热情互助多,前沿趋势多。如果你热爱计量并希望长见识,那欢迎你加入到咱们这个大家庭(戳这里),要不然你只能去其他那些Open access圈子了。注意:进去之后一定要看小鹅“群公告”,不然接收不了群信息,也不知道怎么进入咱们的微信群和计量论坛。
帮点击一下下面的小广告,谢谢支持!